Data advances have influenced each part of human movement and play a possible part to play in the field of schooling and preparing, uniquely, in distance training to change it into an inventive type of involvement. The need of new advances in showing learning measure develops further and quicker. The data age turns into a period of information giving sound and unequaled attainability to disclosure, trade of data, correspondence and investigation to fortify the showing learning measure. Data innovations help in advancing chances of information sharing all through the world. These can help the instructors and understudies having forward-thinking data and information. Exact and right data is vital for compelling educating and learning; and data advances are "set of instruments that can assist with giving the perfect individuals the ideal data at the ideal time." Understudies are free and they can settle on most ideal choices about their examinations, learning time, spot and assets. Understudies can work in collective and intelligent learning conditions adequately imparting, sharing data and trading thoughts and learning encounters with all in the climate.
Актуальность и востребованность темы диссертации. В мировой практике информатизации, системы электронного документооборота (СЭД) в последние годы рассматриваются и внедряются нс только как системы автоматизации процессов управления, но и как полноценные платформы для создания единого информационного пространства, что, безусловно, расширяет границы их использования и повышает к ним интерес со стороны научного сообщества. В исследованиях ведущих ученых сферы инфоком-муникацонных технологий выделяется востребованность задач достоверного сбора, передачи, анализа, кодирования информации при формировании документов делопроизводства для получения эффективных технологий, повышающих мобильность и производительность СЭД.
Комплексные меры, предпринимаемые Правительством Республики Узбекистан по развитию систем регионально-территориального автоматизированного управления и созданию единого информационного пространства, направлены на широкое внедрение информационных систем, СЭД, баз данных (БД) на основе современных информационно-коммуникационных технологий. В связи с этим, разработка новых методов интеллектуальной обработки информационных ресурсов, используемых для повышения качества передачи информации, позволяющих эффективно обнаруживать и исправлять ошибки в структуре электронного документооборота с наименьшими материальными и временными затратами, отличается особой актуальностью и, вместе с тем, остается нерешенной теоретической и прикладной проблемой, имеющей важное народно-хозяйственное значение.
Требования, предъявляемые к информационным ресурсам и потокам передачи данных, как важного фактора эффективности и качества функционирования СЭД выражаются в обеспечении стабильности, целостности, сохранности и достоверности информации. Одним из важных среди факторов является критерий достоверности информации, обусловливающийся искажением передаваемых сообщений в инфокоммуникационных сетях из-за сбоев и отказов технических средств, различного рода помех в каналах связи, ошибок операторов и систем сканирования, а также распознавания.
Следовательно, особый научный интерес представляет построение эффективных систем контроля достоверности передачи и обработки информации, как приоритетной технологии обработки данных, характерной для условий автоматизированного управления и электронного документооборота на предприятиях и в организациях.
Для существующих методов, несмотря на обеспечение высокого уровня достоверности передачи информации, характерен ряд нерешенных вопросов, в качестве основных из которых можно выделить следующие: при разработке технологий электронного документооборота в структуре пакетов передачи данных значительный объем ресурса расходуется на заголовки, вместе с тем большая часть информации заголовков остается неизменной на протяжении потока передачи целого кадра (возникающая при этом избыточность информации и механизмы обеспечения надежности доставки, заключающиеся, в основном, в послании соответствующего сообщения и повторной передаче пакетов, - приводят при обнаружении и устранении ошибок к дополнительным временным и материальным затратам); кодовые и аппаратурные методы контроля передачи информации ориентированы, в основном, на устранение в управляющих полях пакетов одно- и двукратных гранспозиционных ошибок, однако, при передаче данных возникают искажения в информационных полях, которые зачастую проявляются в виде текстовых ошибок более высокой кратности.
В этой связи, решение задач обеспечение достоверности передачи информации целесообразно рассматривать в двух аспектах.
При решении первого типа задач следует учитывать ошибки, вносимые оператором, сканирующими и другими устройствами, предназначенными для ввода информации. Такого вида ошибки составляют наибольший объем искажений текстовой информации и возникают на Прикладном и Представительском уровнях модели OSI (Open System Interconnection reference model).
Во втором типе задач контроля достоверности информации дополнительно учитываются вероятности искажений, возникающих на Транспортном, Сетевом, Физическом и Канальном уровнях OSI.
Восфсбованность диссертации характеризуется тем, что широкое внедрение IP-технологии в электронном документообороте связано с требующими пристального внимания задачами по обнаружению и устранению ошибок при подготовке и оформлении документов.
Данная исследовательская работа ориентирована на обеспечение реализации законов Республики Узбекистан “Об информатизации”, “Об электронной цифровой подписи”, “Об электронном документообороте”, “Об элек тронной коммерции”, “Об электронных платежах”, а также Постановления Кабинета Министров Республики Узбекистан № 126 от 04.05.2011 года «О мерах по внедрению и использованию единой защищенной электронной почты и системы электронного документооборота в исполнительном аппарате кабинета министров, органах государственного и хозяйственного управления, государственной власти на местах».
Исходя из этого, решение перечисленных задач требует проведения специальных исследований и разработок, связанных с созданием методов и алгоритмов, способных осуществлять контроль достоверности информации за счет использования вложенной избыточности, функционировать в сформированной транспортной среде и устранять существующие недостатки. Данное обстоятельство обусловливает необходимость выделения специального класса алгоритмов для обеспечения достоверности информации на основе нового тина PR-избыточности (property redundancy), определяющейся в зависимости от свойств обрабатываемого объекта.
Цель исследования разработка конструктивных методов, моделей, алгоритмов и систем контроля достоверности информации при передаче и обработке данных на основе механизмов использования PR-избыточности, а также их программно-алгоритмическая реализация при разработке технологий электронного документооборота.
Научная новизна диссертационного исследования заключается в следующем:
разработаны концепции, методологии и программно-алгоритмические основы построения методов, моделей и алгоритмов обеспечения достоверности информации в системах электронного документооборота, выделены классы объектов, характеризующиеся PR-избыточностью, применяемой для обеспечения точности, целостности, оперативности, сжатия, доступности информационных ресурсов в СЭД;
предложены методы и алгоритмы контроля достоверности информации за счет использования искусственной избыточности на основе механизмов линейного, модульного, плоскостного суммирований и определения принадлежности к закодированным подмножествам;
разработаны методы и программный комплекс контроля достоверности информации за счет использования естественной избыточности на основе алгоритмов статистического, арифметического, парсингового кодирования, n-граммного структурированного описания, статистического распознавания и хеширования элементов текстов;
предложены методы и алгоритмы конгроля и коррекции орфографических ошибок в текстах на узбекском языке на основе моделей многоуровневого морфологического анализа и описания п-граммной грамматики;
разработаны методы и алгоритмы конгроля достоверности информации за счет использования структурно-технологической PR-избыточности на основе вложенных логических критериев, баз данных и знаний в составе встроенных экспертных систем;
разработаны методы синтеза алгоритмов контроля достоверности информации в системе интерактивного обнаружения и исправления ошибок при разработке технологий электронного документооборота.
Заключение.
1. Разработанные в диссертации на основе концепций системного анализа, управления и обработки информации конструктивные методы, модели и программно-алгоритмические комплексы обеспечения достоверности информации по принципам использования PR-избыточности позволяют повысить эффективность и производительность СЭД.
2. Оценка современного состояния теории и практики кодовых, аппаратурных и программных методов контроля достоверности передачи информации показала недостаточность использования существующих типов избыточности для обеспечения качественного функционирования СЭД. Принципы использования PR-избыточности электронных документов при разработке прикладных методов и программно-алгоритмических комплексов обеспечения достоверности передачи информации позволили спроектировать инструментарий развития существующих технологий.
3. Методы: линейного, плоскостного и модульного суммирования; кодирования ио правилам Хаффмана, Лемпеля-Зива-Велча, Барроуза-Вилера, арифметического кодирования, статистического распознавания, логического контроля образуют методические основы использования PR-избыточности для расширения возможностей алгоритмов и программных комплексов обеспечения достоверности информации при составлении, передаче и обработке текстов электронных документов.
4. Установлено, что разработанные алгоритмы до 92% обнаруживают все виды ошибок, способны исправлять однократные, двукратные и смежные гранспозиционныс ошибки и ио сравнению с существующим методами снижают трудоемкость и стоимость процедур контроля в 2-3 раза при вероятности ошибок P ≈3 4⋅10−3 а также повышают достоверность информации до трех порядков. Оценки эффективности и решения задач контроля достоверности информации получены ио критерию вероятностей необнаружения ошибок.
5. Для решения задач контроля и коррекции орфографических ошибок в текстах на узбекском языке разработаны методы, алгоритмы и системы, включающие в себя морфологические и n-граммные структурированные модели. Разработанная методика получения частотных характеристик п-грамм на основе статистики вероятностных показателей искажений применяется при систематизации хеш-кодов для парсингового кодирования.
6. Интерполяционные и экстраполяционные методы построения логической и арифметической функции статистического распознавания применены при разработке алгоритмов контроля достоверности изображений элементов текста. Предложены методы контроля достоверности сигнальных характеристик изображений элементов текста в нейросетевой системе обработки информации, которая включает звенья автоматического распознавания и контроля сигналов изображений. Методы и алгоритмы реализуются в структуре системы контроля достоверности информации на основе определения принадлежности признаков и классификации объектов метатекста СЭД ио нечеткой семантической гиперсети.
7. Модели, алгоритмы контроля достоверности информации, основанные на методы словарного, статистического и хеш-кодирования, обеспечивают эффективное применение программно-аппаратной среды параллельных вычислений NVIDIA с использованием стандартных библиотек численного анализа, оптимизированного обмена данными между CPU и GPU.
8. Разработаны архитектура и идентифицированы способы описания программной оболочки системы контроля орфографии на основе древовидного представления n-граммной грамматики в среде фреймворк Сфинкс-4, реализующей программные модули для различных языковых моделей, использующих PR-избы сочность. Созданный вариант системы снижает число необнаруженных ошибок, стоимость реализации и трудоемкость по сравнению с системой контроля орфографии на основе морфологического анализа до двух порядков.
9. Разработанные моделирующие алгоритмы, комплексы программных средств и системы контроля достоверности информации на основе использования PR-избы сочности нашли практическое применение в системах автоматизированной организации учебной среды в ВУЗах; адаптированной передачи, обработки и анализа данных в инфокоммуникационных сетях; СЭД предприятий и учреждений.
10. Разработанные программные комплексы контроля достоверности информации в СЭД и компьютерная система адаптированной передачи, обработки, анализа данных внедрены в производственных условиях в Самаркандском филиале компании «УзТслском» Государственный Комитет связи, информатизации и телекоммуникационных технологий и в совместном предприятии «Лаззат-Мева», полученные соответствующие акты о внедрении подтверждаю! экономическую эффективность результатов диссертации.
In this paper, importance of preprocessing and techniques in this field such as data cleaning, dimensionality reduction, smoothing, normalization are illustrated. During the research we mentioned some details of techniques above. However, our research includes only theoretical aspect of data preprocessing. The data preprocessing phase while arduous and time-intensive stands as the cornerstone of data science, possessing paramount significance. Neglecting the meticulous cleansing and structuring of data has the potential to undermine the integrity and efficacy of subsequent modeling endeavors.
Статья рассматривает влияние технологических инноваций на обработку данных в международном коммерческом арбитраже. Основное внимание уделяется двум аспектам: возможностям, которые технологии предоставляют для улучшения эффективности и качества арбитражных процедур, и угрозам, связанным с кибербезопасностью и конфиденциальностью данных. Авторы анализируют, как современные технологии могут облегчить сбор, анализ и обмен информацией в ходе разбирательства, но также подчеркивают риски, связанные с хранением и передачей конфиденциальной информации в цифровой форме. Статья призывает к более тщательному регулированию и соблюдению законов о конфиденциальности и защите данных в контексте международного арбитража.
This research is on the onomatopoeia or onomatopoeic expressions or words and meaning of onomatopoeias found in the children’s literature “Paddington” by Michael Bond, data analysis was classified into four classifications, the classification of the types of onomatopoeia based on Bredin (1996), the classification by the sound it describes, onomatopoeia meaning based on dictionary and Contextual meaning. This study was descriptive qualitative research. The result of this research showed that there were 103 onomatopoeia or onomatopoeic words that could be found in the comic. From the 103 expressions, 66 onomatopoeia expressions are similar to 38 onomatopoeic expressions found by the researcher. Based on the types, 23 of the data belong to direct onomatopoeia, 9 belong to Associative onomatopoeia and 6 belong to Exemplary on omatopoeia. Based on the classification of onomatopoeia by the sound it describes the researcher found 17 Human sound data, 21 other sound data, 2 animal sound data, and 1 instrument sound data. Most of the data were direct onomatopoeia because most of the onomatopoeic expressions in the children’s book entitled “Paddington” were words, which represent the sound of action.
Цель работы: Исследование и разработка эффективных методов
контроля и диагностики элементов систем передачи данных.
Методы исследования: При решении поставленных задач использовались аналитические и программные методы исследования, включая разработанные модели и методики с последующей обработкой и анализом полученных результатов. Аналитические методы базировались на теории вероятностей, теории графов, теории надежности, теории алгебры
логики, методах машинного моделирования.
Полученные результаты и их новизна: Каскадная модель источника ошибок дискретного канала и стратегия диагностики и восстановления работоспособности элементов СПД. Математическая модель средств встроенного контроля элементов СПД без и с самоконтролем и оценка величины их эффективного объема. Методики оценки достоверности контроля и расчета эталонных сигнатур. Алгоритмы поиска неисправностей, при использовании ст натурного анализа, минимизирующие время поиска. Имитационная модель для оценки достоверности методов компактного тестирования и формирования эталонных сигнатур.
Практическая значимость: Разработанные методики, алгоритмы и программы рекомендованы для практического использования при разработке контрольно-диагностического обеспечение на стадии эксплуатации элементов СПД.
Степень внедрения и экономическая эффективность: Результаты диссертационной работы внедрены в АК «Узбектелеком». Теоретические и практические результаты работы используются в учебном процессе ТУИТ по направлению образования «Телекоммуникации» и специализации 5А5222205 - «Сети связи и системы управления».
Область применения: Предложенные методики, алгоритмы и программы могут найти широкое применение при эксплуатации систем передачи данных, при разработке конгрольно-диагностического обеспечения цифровых систем и устройств телекоммуникационного оборудования.
In world practice, it is important to develop targeted strategies aimed at further improving the business environment, implementing active business projects to en sure sustainable economic development, pursuing economic policies that have a positive effect on business development, conducting research aimed at using blockchain technology as well as ensuring interest in business development by state and society. The issues of doing business after the global crisis caused by the pandemic, statistical observation, and forecasting issues, statistical assessment of the impact of the pandemic on business entities, and improving methods of statistical analysis of business development processes during and after the pandemic became important as never before. As a result of the conducted research, the authors have reached assessing quantitative and qualitative indicators of factors affecting business development processes has been developed, and software has been created that makes the accurate analyzes on the basis of blockchain of the data, a comprehensive analytical approach was developed based on statistical indicators characterizing business development trends in the country, in the SNA sectors, in the context of key industries and regions, multifactor empirical models were developed and forecast options for 2021-2026 were proposed using the scenario method. The theoretical approaches and the initial data used are taken from offcial sources, based on the data of business entities operating in Uzbekistan, proposals, and recommendations implemented in practice, statistical data of the State Committee on Statistics of the Republic of Uzbekistan, as well as primary data obtained during the study. The proposed blockchain stages in the busine process accurately evaluate the results that meet the requirements of digital economy.
The remarkable development of accessible data sources has enormously impacted the admittance to useable wellbeing data. As an outcome, restoratively one-sided data has become hard to use for navigation. In this paper, we consider these outcomes and present an improved technique for getting to wellbeing data continuously. The methodology includes the utilization of the vapnik Backing Vector Machine process for text grouping. The proposed technique was frameworked on php/mysql for web client. Trial arrangement shows that the strategy outflanks the pattern in the Accuracy, Review and F1 measures. An expansion utilizing the Gaussian portion is suggested in the paper.
Системы обнаружения и предотврашение вторжений (IDS, IDPS) - одно из решений, реализованных против вредоносных сетевых атак. Внедрение системы IDS и IDPS затруднено, поскольку злоумышленники постоянно меняют инструменты и методы, которые они используют. В статье представлены проблемы и преимущества использования технологий интеллектуального анализа данных для устранения сетевых атак. Разработаны методы и средства при формировании системы обнаружения вторжений на основе интеллектуального анализа данных оперативного анализа и эффективного реагирования, позволяющие избавиться от некоторых известных недостатков систем сигнатурного поиска и обнаружения аномалий